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Introduction 

El ejercicio del periodismo de ciencia va mas alia de proveer informacion sobre avances 
cientificos o tecnologicos. Parte importante de este quehacer consiste en que el periodista 
sea capaz de dotar a sus productos periodisticos de informacion y conocimientos basicos 
sobre el tema para facilitar a los ciudadanos la toma de decisiones respecto de su propia 
persona y de su colectividad, como lo explican algunos autores. 1 De ahi la importancia de 
evaluar el contenido de la prensa escrita a partir de parametros tales como el caracter 
noticioso del hecho, las fuentes de informacion consultadas y la forma en que se presentan 
al lector. 



Para hacer esta tarea, comunmente, la hemeroteca es la primera fuente a la que se acude 
cuando deseamos revisar o recopilar notas periodisticas atrasadas. El mecanismo de 
busqueda se efectua de forma manual y una revision minuciosa de los ejemplares puede 
garantizar un rastreo completo de las notas. No obstante, los obstaculos a los que se 
enfrenta el usuario durante la recopilacion, como la demora en la entrega del material 
solicitado; material hemerografico en restauracion; falta de ejemplares en el archivo; 
material en posesion de otro usuario; material incompleto y sobre todo saber, de antemano, 
que debido a su impacto social el numero de notas del hecho sera amplio, esto convierte a 
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la busqueda, al final, en tiempo significativamente perdido. Por esta razon, nos propusimos 
usar un mecanismo que cumpliera con criterios determinados y redujera el tiempo 
empleado en la recoleccion del material periodistico. 

Trejo Delarbre (1996) argumenta que la digitalizacion de la informacion es el sustento de la 
nueva revolution informatica. La singularidad del Internet es la facilidad para que diversos 
grupos cuenten con acceso no solo a la recepcion de mensajes, sino tambien a la 
propagacion de ellos. Por otra parte, Islas (2005) agrega que la Internet posee la capacidad 
de proporcionar servicios personalizados que respondan a las exigencias de cada usuario. 
A partir de este cumulo de ventajas ciberneticas, decidimos buscar en la red de redes una 
herramienta de rastreo que cumpliera nuestras demandas de busqueda de archivos 
hemerograficos de origen diverse 

Hoy en dia los motores de busqueda son el mecanismo primario para encontrar informacion 
en la red." Son considerados "una aplicacion de Internet utilizados para localizar 
documentos y paginas web, partiendo de las keywords o palabras clave. Los motores de 
busqueda mas poderosos o sofisticados rastrean Internet en busca de sitios web y sus 
bases de datos para responder con el maximo de posibilidades a sus usuarios. Esta ultima 
accion la desarrollan los robots conocidos como bots, aranas y rastreadores, -en ingles 
spiders y crawlers respectivamente-. Una vez realizada la operation de busqueda se ofrece 
en pantalla el listado de documentos con los enlaces que les corresponden para poder 
acceder tan solo haciendo die en cualquiera de ellos". 1 " 
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Metodologfa 

Partiendo del supuesto de que reunir el material por medio de los motores, a diferencia del 
metodo manual, aseguraria la reduccion del tiempo empleado en esta tarea, consideramos 
indispensable, como primer paso, determinar criterios y homologar el mecanismo para una 
recopilacion eficiente. 



Tema 


Reforma energetica 2008 


Influenza H1N1 2009 


Palabra clave 


pemex, energetica 


influenza, epidemia 


Periodo 


PI: 8-9 abril 2008 
P2: 13-14 mayo 2008 
P3: 23-24 octubre 2008 
P4: 28-29 octubre 2008 


P5: 23-24 abril 2009 
P6: 29-30 abril 2009 
P7: 4-5 mayo 2009 
P8: 10-11 mayo 2009 


Medios 


www.jornada.unam.mx 

www.eluniversal.com.mx 

www.reforma.com 



FIGURA 1. Criterios de busqueda 

La seleccion de los temas responde a la relevancia que tuvieron en las agendas noticiosas 
de la prensa mexicana; asimismo, se trata de asuntos cuyas bases se sostienen en 
conocimientos cientificos y sus efectos aun repercuten en la actualidad. Para este ejercicio 
elegimos el debate de la reforma energetica en 2008 y el brote del virus de influenza A 
(H1N1) en 2009. 

Los terminos "energetica y pemex" e "influenza y epidemia" fueron las palabras clave 
seleccionadas para este experimento, ya que engloban y representan el tema en general. 
Asimismo decidimos usar terminos simples, los cuales incrementan la precision en la 
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busqueda, a diferencia de terminos compuestos formados por dos o mas palabras." 

El periodo establecido para este ejercicio abarco ocho periodos de dos dias cada uno, en 

total 16 consultas. Para los primeros cuatro periodos se utilizaron las palabras clave 

"energetica" y "pemex"; y para los otros cuatro se asigno "influenza" y "epidemia". Cada 

intervalo de fechas se ajusta al tiempo en que sucedieron los acontecimientos y su eleccion 

fue aleatoria. 

Los medios o sitios en los cuales se efectuaron las consultas fueron: La Jornada (1_J), 

Reforma (R) y El Universal (U), debido a su impacto en la sociedad y a su tiraje. 

Ya establecidos estos criterios, acudimos a la Hemeroteca Nacional de Mexico para revisar 
cada ejemplar de manera exhaustiva y reunir las notas publicadas de cada diario; la 
revision se efectuo en dos ocasiones para extraer el material completo y evitar la omision 
de alguna nota. Posteriormente, seleccionamos entre los diversos motores de busqueda en 
la Internet, aquel que cumpliera con nuestras necesidades. 

Descubrimos que varios periodicos con formato electronico ofrecen un buscador interno 
para rastrear informacion en sus propias paginas. No obstante, nos resistimos a utilizar este 
mecanismo a fin de evitar las diferencias e incluso las inconsistencias que los distintos 
motores podrfan presentar y decidimos servirnos de una misma herramienta para los tres 
medios elegidos. 



Durante el analisis elaboramos una lista con 29 motores de busqueda, clasificados de 
acuerdo a las modalidades que ofrecfan: Busqueda Simple (BS) V y Busqueda Avanzada 
(BA), siendo esta ultima el primer parametro para elegirlos. A diferencia de la primera, la BA 
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ofrece cuadros de texto para delimitar informacion en una consulta especializada y obtener 
resultados potencialmente mejores. 

De los 29 solo 19 motores contaron con Busqueda Avanzada; no obstante, en la mayoria 
de los 19 resultados de BA se omitia la opcion para definir el intervalo de fechas, lo cual 
obligaba a someter los resultados del experimento a un nuevo filtro tomando como 
referenda los tres campos especificos de la busqueda: palabra clave, medio o sitio e 
intervalo de fechas. 

Tras un analisis detallado, Google™ fue el unico motor de busqueda que ofrecio esta 
refinacion en las consultas. La BA en Google tambien carecia de uno de los parametros 
solicitados, sin embargo en una revision minuciosa encontramos que Google cuenta con 
una herramienta especial para extraer noticias: La busqueda Avanzada en el Archivo de 
Google Noticias. 



No 


Motores de 
busqueda 


Direccion 


Formato de busqueda 


1 


CompuServe 


(http://webcenters.netscape.com 
puserve.com/menu) 


BS 


2 


Mamma 


(http://www.mamma.com) 


BS 


3 


Lycos 


(http://search.lycos.com) 


BS 


4 


Ciao 


(http://www.ciao.es/teoma com 
330723) 


BS 


5 


Scoopler 


(http://www.scoopler.com) 


BS 


6 


Onriot 


(http://www.oneriot.com) 


BS 


7 


Todalanet 


(http://www.todalanet.net/) 


BS 


8 


Ipselon 


(http://ipselon.com/es/) 


BS 
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9 


About 


(http://www.about.com/) 


BS 


10 


Webcrawler 


(http://www.webcrawler.com/) 


BS y la busqueda la realiza a 
traves de otros motores: 
Google, Yahoo, Bing y Ask 


11 


MSN 


(http://prodigy.msn.com) 


BS y BA. En la BA no permite 
elegir un intervalo de fechas y 
la realiza a traves de Bing 


12 


AOL 


(http://www.aol.com) 


BS y BA. En la BA no permite 
elegir un intervalo de fechas 


13 


Ask 


(http://es.ask.com) 


BS y BA. En la BA no permite 
elegir un intervalo de fechas 


14 


Altavista 


(http://mx.altavista.com) 


BS y BA. La BA cuenta con los 
elementos requeridos. v " 


15 


Gigablast 


(http://www.gigablast.com) 


BS y BA. En la BA no permite 
elegir un intervalo de fechas 


16 


Snap 


(http://www.snap.com) 


El formato de BS y BA es el 
mismo 


17 


Yahoo 


(http://mx.yahoo.com) 


BS y BA. En la BA no permite 
elegir un intervalo de fechas 


18 


Alltheweb 


(http://www.alltheweb.com) 


BS y BA. En BA solo falta 
medio 


19 


Hotbot 


(http://www.hotbot.com) 


BS y BA. En la BA no permite 
elegir un intervalo de fechas 


20 


Infospace 


(http://search.infospace.com) 


BS y BA. En la BA no permite 
elegir un intervalo de fechas 


21 


Metacrawler 


(http://www.metacrawler.com) 


BS y BA. En la BA no permite 
elegir un intervalo de fechas 


22 


Ixquick 


(http://www.ixquick.com/esp/) 


BS y BA. En la BA no permite 
elegir un intervalo de fechas 


23 


Dogpile 


(http://www.dogpile.com) 


BS y BA. En la BA no permite 
elegir un intervalo de fechas 


24 


Search 


(http://www.search.com) 


BS y BA. En la BA no permite 
elegir un intervalo de fechas 


25 


Mostercrawler 


(http://monstercrawler.com/) 


BS y BA. En la BA no permite 
elegir un intervalo de fechas. la 
realiza a traves de otros 
motores: Google, Yahoo, Bing 
yAsk 


26 


Bing 


(http://www.bing.com/) 


BS y BA. En la BA no permite 
elegir un intervalo de fechas 


27 


Excite 


(http://www.excite.com/) 


BS y BA. En la BA no permite 
elegir un intervalo de fechas 


28 


Go 


(http://www.go.com/) 


BS y BA. En la BA no permite 
elegir un intervalo de fechas y 
la realiza a traves de Yahoo 



Morelia, Michoacan - Mexico • Octubre, 201 1 



XVIII 



de Divulgation de la Ciencia y la Tecnica 



2do. Congreso Estatal de Difusion y Divulgacion de la Ciencia y la Tecnologfa 



29 



Google 



(http://.www. google. com/) 



BS y BA. La BA cuenta con los 
elementos requeridos. 



FIGURA 2. Clasificacion de los motores de busqueda 

La tabla muestra la clasificacion en motores con Busqueda Simple (BS) 
y Busqueda Avanzada (BA), en esta ultima clasificacion se describen las 
caracterfsticas con las que cuenta cada buscador. 



Para acceder a la aplicacion de La busqueda Avanzada en el Archivo de Google Noticias 
usamos la direccion URL: http://news.qooqle.com.mx/archivesearch/advanced search , 
la cual nos despliega la siguiente ventana: 



CjOOQIC noticias Busqueda avanzada en el archivo de Google Noticias suaerencias para ia Msoueda 



avanzada &n si archivo | Ac&rca ds la busousda sr 
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ds 
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p. ej., New Yort 


Times o News Bank 




Visualizacion 


Mostrar cronologia de noticias 
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' 
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' 




i 


' 







Medio 



Palabra clave 



Intervalo de 
fechas 



FIGURA 3. Ventana principal de Busqueda avanzada en 
el archivo de Google Noticias 

La ventana muestra los campos espeefficos para realizar la busqueda 
con frase exacta, fecha, medio, etcetera 



Morelia, Michoacan - Mexico • Octubre, 201 1 



XVIII 



de Divulgation de la Ciencia y la Tecnica 



2do. Congreso Estatal de Difusion y Divulgacion de la Ciencia y la Tecnologfa 



Resultados 

De la revision directa en la hemeroteca, elaboramos una tabla con los resultados de los 
ejemplares y descubrimos que el comportamiento de la cobertura hecha por los tres 
periodicos para cada tema es cuantitativamente similar: de la Reforma energetica La 
Jornada obtuvo 218 notas; Reforma 195 y El Universal 128 notas; mientras que para el 
tema de la influenza A (H1N1) La Jornada muestra 466, Reforma 494 y El Universal 429 
notas. Tras la revision de los tres diarios en las fechas establecidas (16 pares de dias, 
cuatro para cada palabra), la base de datos quedo conformada como se muestra en la 
siguiente tabla: 



Palabra clave 


Reforma Energetica en prensa 




LJ 


R 


U 


pemex 


113 


113 


70 


energetica 


105 


82 


58 


TOTAL 


218 


195 


128 



8 



Palabra clave 


Influenza en prensa 


LJ 


R 


U 


influenza 


323 


359 


282 


epidemia 


143 


135 


147 


TOTAL 


466 


494 


429 



FIGURA 4. Resultado total de la revision hemerografica de ambos temas en los tres 

periodicos 
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Al comparar los resultados de la hemeroteca con los obtenidos de Google Noticias 
se aprecia la notablemente inconsistencia entre ellos. En el tema energetico la 
busqueda de La Jornada encontro 199 notas electronicas de las 218 que publico la 
prensa, la consulta de El Universal mostro 264 por las 128 del impreso y en el caso 
de Reforma unicamente 11 de las 195. 

Respecto del tema de la influenza, la consulta electronica de La Jornada arrojo 684 
de 466 notas impresas, El Universal 751 de 429 y en Reforma 49 de 494 notas. 



Palabra clave 


Reforma Energetica en Google 


LJ 


R 


U 


pemex 


101 


6 


114 


energetica 


98 


5 


150 


TOTAL 


199 


11 


264 




Palabra 
clave 


Influenza en Google 


LJ 


R 


U 


influenza 


461 


34 


527 


epidemia 


223 


15 


224 


TOTAL 


684 


49 


751 



9 



FIGURA 5. Resultado total de la revision en Google Noticias 



Para entender mejor el comportamiento de Google, decidimos clasificar la information de la 
siguiente manera: 

• Notas comunes .- aquellas notas encontradas por ambos medios: hemeroteca y 
motor de busqueda 

• Notas exceso .- notas que solo aparecen en Google, por lo tanto son un exceso 
respecto de la base de datos elaborada a partir de la revision hemerografica 

Morelia, Michoacan - Mexico • Octubre, 201 1 



XVIII 



de Divulgation de la Ciencia y la Tecnica 



2do. Congreso Estatal de Difusion y Divulgacion de la Ciencia y la Tecnologfa 



• Notas deficit -, notas que no aparecen en la consulta de Google, pero estan en la 
base de notas de los periodicos 

Las tres variables nos ayudaron a determinar la eficiencia del motor de busqueda y a 
observar un panorama mas detallado de los resultados para cada periodico. 



TEMA 


MEDIO 


NOTAS 

(edicion 
impresa) 


Google 


EXCESO 


DEFICIT 


COMUNES 


pemex/energetica 


LJ 


218 


199 


51 


70 


148 


R 


195 


11 


5 


189 


6 


U 


128 


264 


198 


62 


66 


influenza/epidemia 


LJ 


466 


684 


322 


104 


362 


R 


494 


49 


34 


479 


15 


U 


429 


751 


563 


241 


188 



FIGURA 6. Total de las notas extrafdas de la hemeroteca y Google de los tres 

diarios y los dos temas 



10 



La Jornada 

De los tres diarios, La Jornada arrojo menos inconsistencias. De las 684 notas rescatadas 
en la edicion impresa, la herramienta electronica encontro 510; es decir que su rendimiento 
fue del 75%, asimismo la consulta en el buscador omitio 174; un deficit del 25%. El exceso 
fue superior ya que increments el numero de notas a mas del 50% respecto de la base 
original. Para este medio, la variable del exceso o las "inventadas por Google" fueron 
aquellas notas procedentes de los diarios regionales™, principalmente de Guerrero (60); 
Jalisco (49); Michoacan (63); Morelos (55); Oriente (120); San Luis (19) y otros (7). 
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Palabra clave 


LJ 


Google 


Comunes 


Exceso 


Deficit 


pemex 


113 


101 


75 


26 


38 


enegetica 


105 


98 


73 


25 


32 


influenza 


323 


461 


233 


228 


90 


epidemia 


143 


223 


129 


94 


14 


TOTAL 


684 


883 


510 


373 


174 



Reforma 



De las 689 notas publicadas en la edition impresa, Google encontro el 3% (21 notas), de 
ahi que la herramienta presentara un deficit del 97% respecto del grupo testigo y un exceso 
del 6% al reportar solo 39 notas. 



Palabra clave 


R 


Google 


Comunes 


Exceso 


Deficit 


pemex 


113 


6 


3 


3 


110 


energetica 


82 


5 


3 


2 


79 


influenza 


359 


34 


10 


24 


349 


epidemia 


135 


15 


5 


10 


130 


TOTAL 


689 


60 


21 


39 


668 



11 



El Universal 

De los tres diarios, este presento mayor indice de exceso. Durante la revision 
hemerografica se reportaron 557 notas; en Google los valores se excedieron casi al doble 
con 1015 notas, de las cuales solo 254 fueron comunes (46%). La busqueda electronica 
arrojo 761 notas de exceso y clasificamos la distribution de esta variable de la siguiente 
manera: 550 corresponden a las emisiones de Minuto x Minuto 1 ", 3 son publicaciones del El 
Grafico*, 46 pertenecen a El Universal de Caracas, Venezuela y 163 a otros. 



Morelia, Michoacan - Mexico • Octubre, 201 1 



XVIII 



de Divulgation de la Ciencia y la Tecnica 



2do. Congreso Estatal de Difusion y Divulgacion de la Ciencia y la Tecnologfa 







Palabra clave 


U 


Google 


Exceso 


Deficit 


Comunes 


pemex 


70 


114 


76 


32 


38 


energetica 


58 


150 


122 


30 


28 


influenza 


282 


527 


407 


162 


120 


Epidemia 


147 


224 


156 


79 


68 


TOTAL 


557 


1015 


761 


303 


254 



En un esfuerzo por detallar los datos obtenidos por Google presentamos graficas por tema 
para mostrar las variables de exceso y deficit de los 16 experimentos. 

D'ficit total pemex y energ tica 
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Exceso total pemex y energ "tica 
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FIGURA 7. Deficit y exceso de Google en los tres diarios del tema 

energetico 
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Deficit total influenza-epidemia 
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FIGURA 8. Deficit y exceso de Google en los tres diarios del tema de la 

influenza 



Conclusion 



Al ser un estudio puramente cuantitativo, encontramos que los valores finales obtenidos del 
experimento no proporcionan los argumentos validos para explicar el proceder de Google 
durante las consultas. Lo que si detectamos fue la existencia de indicadores externos 
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(formato en que los diarios indexan sus paginas) e internos (mecanismo del algoritmo de 
Google) causantes de las tendencias del deficit y exceso. 

Los presentes resultados confirman, basicamente, que el comportamiento de Google 
depende de la amplitud de la cobertura del hecho noticioso, pues observamos que al 
incrementarse el numero de notas aparecen mayores inconsistencias en el motor de 
busqueda; por otro lado, cuando el numero de notas se mantiene por debajo de las 100 se 
muestra cierta estabilidad. Con estos resultados enunciamos que Google no cumple con el 
rendimiento indispensable para compilar material hemerografico sobre temas noticiosos de 
manera optima. 

Tambien creemos que por las caracterfsticas y el tamano del experimento, no es posible 
hacer una generalization sobre la eficiencia de Google Noticias; de hacerlo, seria necesario 
ampliar la muestra (como recomiendan los expertos en analisis estadistico). No obstante, la 
Busqueda Avanzada en el Archivo de Noticias de Google puede brindar excelentes 
resultados a aquellos usuarios que necesitan una recopilacion somera de notas sobre un 
tema especifico para tener una nocion del hecho y de la cobertura realizada por la prensa. 
Asimismo queda abierta la posibilidad de continuar con la investigacion y mejorar los 
resultados obtenidos acerca de como los efectos de los indicadores externos e internos 
repercuten con los resultados electronicos a traves de un mayor numero de consultas 
basadas en los parametros de busqueda establecidos. 



14 
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La mayoria de los motores de busqueda ofrecen esta opcion, en la cual el usuario introduce una consulta y el 
rastreador realiza una busqueda general, sin especificaciones ni parametros que delimiten los resultados. 

Google selecciona artfculos de miles de fuentes de noticias en Ifnea, y luego los presenta por tema y por 
categorfa. Google Noticias utiliza los sofisticados algoritmos de computadora para agrupar y clasificar las 
noticias. La ventaja de este sistema es que Google puede recopilar historias mucho mas rapido que la mayoria 
de los servicios de agregacion de noticias. Sarah Milstein, J. D. Bierdorfer y Matthew MacDonald, Google: The 
missing manual, Estados Unidos, O'Reilly Media, 2006, 2a edicion, pp. 91 y 92. 

Altavista al igual que Google ofrece campos especfficos para la busqueda especializada requerida, sin 
embargo al someterla a las pruebas de consulta nos encontramos que solo funciona con algunos diarios y en 
otros casos nos traslada al buscador de Yahoo. 

viii 

La Jornada cuenta con una serie de periodicos que cubren areas regionales dentro de la Republica 
Mexicana, estas son: La Jornada Aguascalientes, La Jornada Guerrero, La Jornada Jalisco, La Jornada 
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Michoacan, La Jornada Morelos, La Jornada Oriente, La Jornada San Luis, La Jornada Veracruz, La Jornada 
Zacatecas 

ix 

Seccion de noticias breves publicadas exclusivamente en version electronica, abarcan todas las secciones y 
son actualizadas cada 4 minutos en linea 
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